The cover is the face of a book and is a point of attraction for the readers. Designing book covers is an essential task in the publishing industry. One of the main challenges in creating a book cover is representing the theme of the book's content in a single image. In this research, we explore ways to produce a book cover using artificial intelligence based on the fact that there exists a relationship between the summary of the book and its cover. Our key motivation is the application of text-to-image synthesis methods to generate images from given text or captions. We explore several existing text-to-image conversion techniques for this purpose and propose an approach to exploit these frameworks for producing book covers from provided summaries. We construct a dataset of English books that contains a large number of samples of summaries of existing books and their cover images. In this paper, we describe our approach to collecting, organizing, and pre-processing the dataset to use it for training models. We apply different text-to-image synthesis techniques to generate book covers from the summary and exhibit the results in this paper.
translated by 谷歌翻译
Active target sensing is the task of discovering and classifying an unknown number of targets in an environment and is critical in search-and-rescue missions. This paper develops a deep reinforcement learning approach to plan informative trajectories that increase the likelihood for an uncrewed aerial vehicle (UAV) to discover missing targets. Our approach efficiently (1) explores the environment to discover new targets, (2) exploits its current belief of the target states and incorporates inaccurate sensor models for high-fidelity classification, and (3) generates dynamically feasible trajectories for an agile UAV by employing a motion primitive library. Extensive simulations on randomly generated environments show that our approach is more efficient in discovering and classifying targets than several other baselines. A unique characteristic of our approach, in contrast to heuristic informative path planning approaches, is that it is robust to varying amounts of deviations of the prior belief from the true target distribution, thereby alleviating the challenge of designing heuristics specific to the application conditions.
translated by 谷歌翻译
Assigning qualified, unbiased and interested reviewers to paper submissions is vital for maintaining the integrity and quality of the academic publishing system and providing valuable reviews to authors. However, matching thousands of submissions with thousands of potential reviewers within a limited time is a daunting challenge for a conference program committee. Prior efforts based on topic modeling have suffered from losing the specific context that help define the topics in a publication or submission abstract. Moreover, in some cases, topics identified are difficult to interpret. We propose an approach that learns from each abstract published by a potential reviewer the topics studied and the explicit context in which the reviewer studied the topics. Furthermore, we contribute a new dataset for evaluating reviewer matching systems. Our experiments show a significant, consistent improvement in precision when compared with the existing methods. We also use examples to demonstrate why our recommendations are more explainable. The new approach has been deployed successfully at top-tier conferences in the last two years.
translated by 谷歌翻译
2019年新型冠状病毒疾病(Covid-19)是一种致命的传染病,于2019年12月在中国武汉武汉(Wuhan)首次识别,并且一直处于流行状态。在这种情况下,在感染人群中检测到Covid-19变得越来越重要。如今,与感染人群数量相比,测试套件的数量逐渐减少。在最近的流行条件下,通过分析胸部CT(计算机断层扫描)图像诊断肺部疾病已成为COVID-19患者诊断和预言的重要工具。在这项研究中,已经提出了一种从CT图像检测COVID-19感染的转移学习策略(CNN)。在拟议的模型中,已经设计了具有转移学习模型V3的多层卷积神经网络(CNN)。与CNN类似,它使用卷积和汇总来提取功能,但是该传输学习模型包含数据集成像网的权重。因此,它可以非常有效地检测功能,从而使其在获得更好的准确性方面具有优势。
translated by 谷歌翻译
源代码存储库由大型代码库组成,通常包含容易发生的程序。软件的复杂性日益增加导致时间和识别这些缺陷的时间和成本急剧上升。存在各种方法可以自动生成错误代码的修复程序。但是,由于特定错误的可能解决方案的组合空间很大,因此没有很多工具和数据集可以有效地评估生成的代码。在这项工作中,我们介绍了FixeVal,这是一个基准,其中包括竞争性编程问题及其各自修复程序的基准。我们引入了丰富的测试套件,以评估和评估模型生成程序修复的正确性。我们将两种在编程语言上鉴定的变压器语言模型视为我们的基准,并使用基于匹配和基于执行的评估指标对其进行比较。我们的实验表明,基于匹配的指标不能准确反映模型生成的程序修复,而基于执行的方法通过专门为该解决方案设计的所有情况和场景评估程序。因此,我们认为FixeVal提供了朝着实际自动错误修复和模型生成的代码评估的步骤。
translated by 谷歌翻译
差异隐私(DP)已被出现为严格的形式主义,以推理可量化的隐私泄漏。在机器学习(ML)中,已采用DP限制推理/披露训练示例。在现有的工作中杠杆横跨ML管道,尽管隔离,通常专注于梯度扰动等机制。在本文中,我们展示了DP-util,DP整体实用分析框架,跨越ML管道,重点是输入扰动,客观扰动,梯度扰动,输出扰动和预测扰动。在隐私敏感数据上给出ML任务,DP-Util使ML隐私从业者能够对DP在这五个扰动点中的影响,以模型公用事业丢失,隐私泄漏和真正透露的数量来测量DP的影响。训练样本。我们在视觉,医疗和金融数据集上使用两个代表性学习算法(Logistic回归和深神经网络)来评估DP-Uts,以防止会员资格推论攻击作为案例研究攻击。我们结果的一个亮点是,预测扰动一致地在所有数据集中始终如一地实现所有模型的最低实用损耗。在Logistic回归模型中,与其他扰动技术相比,客观扰动导致最低的隐私泄漏。对于深度神经网络,梯度扰动导致最低的隐私泄漏。此外,我们的结果揭示了记录的结果表明,由于隐私泄漏增加,差异私有模型揭示了更多数量的成员样本。总体而言,我们的研究结果表明,为了使使用的扰动机制有明智的决定,ML隐私从业者需要检查优化技术(凸与非凸),扰动机制,课程数量和隐私预算之间的动态。
translated by 谷歌翻译
我们呈Anubis,一个基于高效的机器学习的APT检测系统。我们的Anubis设计哲学涉及两个主要成分。首先,我们打算通过网络响应团队有效利用Anubis。因此,预测解释性是Anubis设计的主要焦点之一。其次,Anubis使用系统来源图来捕获因果关系,从而实现高检测性能。在Anubis的预测能力的核心,有一个贝叶斯神经网络,可以说明它在预测中有多自信。我们评估Anubis对最近的APT数据集(DARPA OPTC),并显示Anubis可以检测到具有高精度的APT活动的恶意活动。此外,Anubis了解高级模式,允许它解释其对威胁分析师的预测。可解释的攻击故事重建的高预测性能使Anubis成为企业网络防御的有效工具。
translated by 谷歌翻译
Covid19 Pandemary已经证明了需要远程学习和虚拟学习应用,如虚拟现实(VR)和基于平板电脑的解决方案。开发人员创建复杂的学习情景是非常耗时的,可能需要一年多。使用系统分析师,开发人员和3D艺术家的团队也是昂贵的。有要求提供简单的方法,使讲师能够为其实验室教程创建自己的内容。已经开发了开发通用模型的研究,以便为需要与实验室资源进行实际交互的科目的半自动创建虚拟学习工具。除了用于创建数字双胞胎的系统之外,还提出了一种描述为电动实验室教程创建虚拟学习应用程序的案例研究。
translated by 谷歌翻译
识别类似于波斯语和Urdu等阿拉伯语的脚本比拉丁语的脚本更具挑战性。这是由于存在二维结构,依赖性字符形状,空间和重叠,以及凹陷的放置。离线手写乌尔通脚本的研究并不多,这是世界上第10个最口语的核心脚本。我们提出了一种基于的编码器 - 解码器模型,用于在上下文中读取URDU。引入了一个新的本地化惩罚,以鼓励模型在识别下一个字符时一次只参加一个位置。此外,我们全面地在地面真实注释方面完善了唯一的完整和公开的手写Urdu数据集。我们评估乌尔都语和阿拉伯语数据集的模型,并显示上下文的注意本地化优于简单的关注和多向LSTM模型。
translated by 谷歌翻译
目的:本文开发了两种算法,以实现联合广泛的线性混合效应模型(GLMM),并将开发模型的结果彼此进行比较,以及从标准R软件包(LME4')中进行比较。方法:通过两种数值方法(Laplace近似和高斯HERMITE近似)近似GLMM的对数可能性函数,该方法支持GLMM的联合分解以将计算带到数据。结果:我们开发的方法可以处理GLMM,以适应联合环境中具有多个非独立观测水平的层次数据。实验结果表明,具有模拟和现实世界数据的可比性(拉普拉斯)和上级(高斯 - 温石)表现。结论:我们开发并比较了具有不同近似值的联合GLMM,可以支持研究人员分析生物医学数据以适应混合效应并解决由于层次结构(即机构,地区,国家等)而引起的非独立性。
translated by 谷歌翻译